<!DOCTYPE html>
<html lang="zh-CN">
<head>
  <meta charset="UTF-8">
<meta name="viewport" content="width=device-width, initial-scale=1, maximum-scale=2">
<meta name="theme-color" content="#222">
<meta name="generator" content="Hexo 5.4.0">
  <link rel="apple-touch-icon" sizes="180x180" href="/myblog/images/apple-touch-icon-next.png">
  <link rel="icon" type="image/png" sizes="32x32" href="/myblog/images/favicon-32x32-next.png">
  <link rel="icon" type="image/png" sizes="16x16" href="/myblog/images/favicon-16x16-next.png">
  <link rel="mask-icon" href="/myblog/images/logo.svg" color="#222">

<link rel="stylesheet" href="/myblog/css/main.css">


<link rel="stylesheet" href="/myblog/lib/font-awesome/css/all.min.css">
  <link rel="stylesheet" href="/myblog/lib/pace/pace-theme-minimal.min.css">
  <script src="/myblog/lib/pace/pace.min.js"></script>

<script id="hexo-configurations">
    var NexT = window.NexT || {};
    var CONFIG = {"hostname":"gao-qianwei.gitee.io","root":"/myblog/","scheme":"Gemini","version":"7.8.0","exturl":false,"sidebar":{"position":"left","display":"post","padding":18,"offset":12,"onmobile":false},"copycode":{"enable":false,"show_result":false,"style":null},"back2top":{"enable":true,"sidebar":false,"scrollpercent":false},"bookmark":{"enable":false,"color":"#222","save":"auto"},"fancybox":false,"mediumzoom":false,"lazyload":false,"pangu":false,"comments":{"style":"tabs","active":null,"storage":true,"lazyload":false,"nav":null},"algolia":{"hits":{"per_page":10},"labels":{"input_placeholder":"Search for Posts","hits_empty":"We didn't find any results for the search: ${query}","hits_stats":"${hits} results found in ${time} ms"}},"localsearch":{"enable":true,"trigger":"auto","top_n_per_article":1,"unescape":false,"preload":false},"motion":{"enable":true,"async":false,"transition":{"post_block":"fadeIn","post_header":"slideDownIn","post_body":"slideDownIn","coll_header":"slideLeftIn","sidebar":"slideUpIn"}},"path":"search.xml"};
  </script>

  <meta name="description" content="一、HDFS简介1.1、HDFS产生背景&amp;ensp;&amp;ensp;&amp;ensp;&amp;ensp;随着数据量越来越大，在一个操作系统管辖的范围内存不下了，那么就分配到更多的操作系统管理的磁盘中，但是不方便管理和维护，迫切需要一种系统来管理多台机器上的文件，这就是分布式文件管理系统。HDFS只是分布式文件管理系统中的一种。">
<meta property="og:type" content="article">
<meta property="og:title" content="HDFS简介">
<meta property="og:url" content="https://gao-qianwei.gitee.io/myblog/2021/05/22/Hadoop%E4%B9%8BHDFS%EF%BC%9AHDFS%E6%A6%82%E8%BF%B0/index.html">
<meta property="og:site_name" content="学无止境">
<meta property="og:description" content="一、HDFS简介1.1、HDFS产生背景&amp;ensp;&amp;ensp;&amp;ensp;&amp;ensp;随着数据量越来越大，在一个操作系统管辖的范围内存不下了，那么就分配到更多的操作系统管理的磁盘中，但是不方便管理和维护，迫切需要一种系统来管理多台机器上的文件，这就是分布式文件管理系统。HDFS只是分布式文件管理系统中的一种。">
<meta property="og:locale" content="zh_CN">
<meta property="og:image" content="https://gao-qianwei.gitee.io/myblog/2021/05/22/Hadoop%E4%B9%8BHDFS%EF%BC%9AHDFS%E6%A6%82%E8%BF%B0/1.png">
<meta property="og:image" content="https://gao-qianwei.gitee.io/myblog/myblog/2021/05/22/Hadoop%E4%B9%8BHDFS%EF%BC%9AHDFS%E6%A6%82%E8%BF%B0/2.png">
<meta property="og:image" content="https://gao-qianwei.gitee.io/myblog/myblog/2021/05/22/Hadoop%E4%B9%8BHDFS%EF%BC%9AHDFS%E6%A6%82%E8%BF%B0/3.png">
<meta property="article:published_time" content="2021-05-22T08:19:27.156Z">
<meta property="article:modified_time" content="2021-05-22T08:28:39.958Z">
<meta property="article:author" content="高乾威">
<meta property="article:tag" content="数据研发">
<meta property="article:tag" content="Hadoop">
<meta property="article:tag" content="HDFS">
<meta name="twitter:card" content="summary">
<meta name="twitter:image" content="https://gao-qianwei.gitee.io/myblog/2021/05/22/Hadoop%E4%B9%8BHDFS%EF%BC%9AHDFS%E6%A6%82%E8%BF%B0/1.png">

<link rel="canonical" href="https://gao-qianwei.gitee.io/myblog/2021/05/22/Hadoop%E4%B9%8BHDFS%EF%BC%9AHDFS%E6%A6%82%E8%BF%B0/">


<script id="page-configurations">
  // https://hexo.io/docs/variables.html
  CONFIG.page = {
    sidebar: "",
    isHome : false,
    isPost : true,
    lang   : 'zh-CN'
  };
</script>

  <title>HDFS简介 | 学无止境</title>
  






  <noscript>
  <style>
  .use-motion .brand,
  .use-motion .menu-item,
  .sidebar-inner,
  .use-motion .post-block,
  .use-motion .pagination,
  .use-motion .comments,
  .use-motion .post-header,
  .use-motion .post-body,
  .use-motion .collection-header { opacity: initial; }

  .use-motion .site-title,
  .use-motion .site-subtitle {
    opacity: initial;
    top: initial;
  }

  .use-motion .logo-line-before i { left: initial; }
  .use-motion .logo-line-after i { right: initial; }
  </style>
</noscript>

</head>

<body itemscope itemtype="http://schema.org/WebPage">
  <div class="container use-motion">
    <div class="headband"></div>

    <header class="header" itemscope itemtype="http://schema.org/WPHeader">
      <div class="header-inner"><div class="site-brand-container">
  <div class="site-nav-toggle">
    <div class="toggle" aria-label="切换导航栏">
      <span class="toggle-line toggle-line-first"></span>
      <span class="toggle-line toggle-line-middle"></span>
      <span class="toggle-line toggle-line-last"></span>
    </div>
  </div>

  <div class="site-meta">

    <a href="/myblog/" class="brand" rel="start">
      <span class="logo-line-before"><i></i></span>
      <h1 class="site-title">学无止境</h1>
      <span class="logo-line-after"><i></i></span>
    </a>
  </div>

  <div class="site-nav-right">
    <div class="toggle popup-trigger">
        <i class="fa fa-search fa-fw fa-lg"></i>
    </div>
  </div>
</div>




<nav class="site-nav">
  <ul id="menu" class="main-menu menu">
        <li class="menu-item menu-item-home">

    <a href="/myblog/" rel="section"><i class="fa fa-home fa-fw"></i>首页</a>

  </li>
        <li class="menu-item menu-item-about">

    <a href="/myblog/about/" rel="section"><i class="fa fa-user fa-fw"></i>关于</a>

  </li>
        <li class="menu-item menu-item-tags">

    <a href="/myblog/tags/" rel="section"><i class="fa fa-tags fa-fw"></i>标签</a>

  </li>
        <li class="menu-item menu-item-categories">

    <a href="/myblog/categories/" rel="section"><i class="fa fa-th fa-fw"></i>分类</a>

  </li>
        <li class="menu-item menu-item-archives">

    <a href="/myblog/archives/" rel="section"><i class="fa fa-archive fa-fw"></i>归档</a>

  </li>
        <li class="menu-item menu-item-links">

    <a href="/myblog/links/" rel="section"><i class="fa fa-link fa-fw"></i>友链</a>

  </li>
      <li class="menu-item menu-item-search">
        <a role="button" class="popup-trigger"><i class="fa fa-search fa-fw"></i>搜索
        </a>
      </li>
  </ul>
</nav>



  <div class="search-pop-overlay">
    <div class="popup search-popup">
        <div class="search-header">
  <span class="search-icon">
    <i class="fa fa-search"></i>
  </span>
  <div class="search-input-container">
    <input autocomplete="off" autocapitalize="off"
           placeholder="搜索..." spellcheck="false"
           type="search" class="search-input">
  </div>
  <span class="popup-btn-close">
    <i class="fa fa-times-circle"></i>
  </span>
</div>
<div id="search-result">
  <div id="no-result">
    <i class="fa fa-spinner fa-pulse fa-5x fa-fw"></i>
  </div>
</div>

    </div>
  </div>

</div>
    </header>

    
  <div class="back-to-top">
    <i class="fa fa-arrow-up"></i>
    <span>0%</span>
  </div>


    <main class="main">
      <div class="main-inner">
        <div class="content-wrap">
          

          <div class="content post posts-expand">
            

    
  
  
  <article itemscope itemtype="http://schema.org/Article" class="post-block" lang="zh-CN">
    <link itemprop="mainEntityOfPage" href="https://gao-qianwei.gitee.io/myblog/2021/05/22/Hadoop%E4%B9%8BHDFS%EF%BC%9AHDFS%E6%A6%82%E8%BF%B0/">

    <span hidden itemprop="author" itemscope itemtype="http://schema.org/Person">
      <meta itemprop="image" content="/myblog/images/avatar.png">
      <meta itemprop="name" content="高乾威">
      <meta itemprop="description" content="报我楼成秋望月，把君诗读夜回灯">
    </span>

    <span hidden itemprop="publisher" itemscope itemtype="http://schema.org/Organization">
      <meta itemprop="name" content="学无止境">
    </span>
      <header class="post-header">
        <h1 class="post-title" itemprop="name headline">
          HDFS简介
        </h1>

        <div class="post-meta">

          
            <span class="post-meta-item">
              <span class="post-meta-item-icon">
                <i class="far fa-calendar"></i>
              </span>
              <span class="post-meta-item-text">发表于</span>
              

              <time title="创建时间：2021-05-22 16:19:27 / 修改时间：16:28:39" itemprop="dateCreated datePublished" datetime="2021-05-22T16:19:27+08:00">2021-05-22</time>
            </span>
            <span class="post-meta-item">
              <span class="post-meta-item-icon">
                <i class="far fa-folder"></i>
              </span>
              <span class="post-meta-item-text">分类于</span>
                <span itemprop="about" itemscope itemtype="http://schema.org/Thing">
                  <a href="/myblog/categories/%E6%95%B0%E6%8D%AE%E7%A0%94%E5%8F%91/" itemprop="url" rel="index"><span itemprop="name">数据研发</span></a>
                </span>
                  ，
                <span itemprop="about" itemscope itemtype="http://schema.org/Thing">
                  <a href="/myblog/categories/%E6%95%B0%E6%8D%AE%E7%A0%94%E5%8F%91/Hadoop/" itemprop="url" rel="index"><span itemprop="name">Hadoop</span></a>
                </span>
                  ，
                <span itemprop="about" itemscope itemtype="http://schema.org/Thing">
                  <a href="/myblog/categories/%E6%95%B0%E6%8D%AE%E7%A0%94%E5%8F%91/Hadoop/HDFS/" itemprop="url" rel="index"><span itemprop="name">HDFS</span></a>
                </span>
            </span>

          
            <span class="post-meta-item" title="阅读次数" id="busuanzi_container_page_pv" style="display: none;">
              <span class="post-meta-item-icon">
                <i class="fa fa-eye"></i>
              </span>
              <span class="post-meta-item-text">阅读次数：</span>
              <span id="busuanzi_value_page_pv"></span>
            </span>
            <span class="post-meta-divider">|</span>

        </div>
      </header>

    
    
    
    <div class="post-body" itemprop="articleBody">

      
        <h3 id="一、HDFS简介"><a href="#一、HDFS简介" class="headerlink" title="一、HDFS简介"></a>一、HDFS简介</h3><h4 id="1-1、HDFS产生背景"><a href="#1-1、HDFS产生背景" class="headerlink" title="1.1、HDFS产生背景"></a>1.1、HDFS产生背景</h4><p>&ensp;&ensp;&ensp;&ensp;随着数据量越来越大，在一个操作系统管辖的范围内存不下了，那么就分配到更多的操作系统管理的磁盘中，但是不方便管理和维护，迫切需要一种系统来管理多台机器上的文件，这就是分布式文件管理系统。HDFS只是分布式文件管理系统中的一种。</p>
<span id="more"></span>

<h4 id="1-2、HDFS概念"><a href="#1-2、HDFS概念" class="headerlink" title="1.2、HDFS概念"></a>1.2、HDFS概念</h4><p>&ensp;&ensp;&ensp;&ensp;HDFS（Hadoop Distributed File System），它是基于<strong>流数据</strong>访问模式的一个文件系统，用于存储文件，通过目录树来定位文件；其次，它是分布式的，由很多服务器联合起来实现其功能，集群中的服务器有各自的角色。<br>&ensp;&ensp;&ensp;&ensp;HDFS的设计适合一次写入，多次读出的场景，且不支持文件的修改。适合用来做数据分析，并不适合用来做网盘应用。</p>
<blockquote>
<p>流数据  是指数千个数据源 持续生成 的数据，可以理解为随时间延续而 无限增长 的动态数据集合。<br>通俗点说，如果把数据比如成一个水库，那么流进去的水，就是流数据（就像我们听的音乐，属于音乐流；而看到的文字、图片这些较为固定的，一次性下载的，形成不了流）。</p>
</blockquote>
<p>&ensp;&ensp;&ensp;&ensp;在Hadoop生态圈中，HDFS属于底层基础，负责存储文件。<br><img src="/myblog/2021/05/22/Hadoop%E4%B9%8BHDFS%EF%BC%9AHDFS%E6%A6%82%E8%BF%B0/1.png" alt="在这里插入图片描述"></p>
<h3 id="二、HDFS优缺点"><a href="#二、HDFS优缺点" class="headerlink" title="二、HDFS优缺点"></a>二、HDFS优缺点</h3><p><strong>优点：</strong></p>
<ol>
<li>高容错性：<ul>
<li>  数据自动保存多个副本。它通过增加副本的形式，提高容错性。</li>
<li>  某一个副本丢失以后，它可以自动恢复。</li>
</ul>
</li>
<li>适合大数据处理。两个维度：数据规模和文件规模<ul>
<li>  数据规模：能够处理数据规模达到 GB、TB、甚至PB级别的数据。</li>
<li>  文件规模：能够处理百万规模以上的文件数量，数量相当之大。</li>
</ul>
</li>
<li> 支持流式数据访问。一次性写入，多次读取（一个数据集一旦生成，就会被复制分发到不同的存储节点，各节点可以进行读取/访问）；保证数据一致性。</li>
<li> 可构建在廉价机器上，通过多副本机制，提高可靠性。</li>
<li> 适合批处理。移动计算而非移动数据；数据位置暴露给计算框架。</li>
</ol>
<p><strong>缺点：</strong></p>
<ol>
<li> 不适合低延时数据访问，比如毫秒级的存储数据，是做不到的。</li>
<li>无法高效的对大量小文件进行存储（重点）<ul>
<li>  存储大量小文件的话，它会占用 NameNode大量的内存来存储文件、目录和块信息。这样是不可取的，因为NameNode的内存总是有限的。</li>
<li>  小文件存储的寻道时间会超过读取时间，它违反了HDFS的设计目标。</li>
</ul>
</li>
<li>不支持并发写入、文件随机修改<ul>
<li>  一个文件只能有一个写，不允许多个线程同时写。</li>
<li>  仅支持数据 append（追加），不支持文件的随机修改。</li>
</ul>
</li>
</ol>
<h3 id="三、HDFS组成架构"><a href="#三、HDFS组成架构" class="headerlink" title="三、HDFS组成架构"></a>三、HDFS组成架构</h3><img src="/myblog/myblog/2021/05/22/Hadoop%E4%B9%8BHDFS%EF%BC%9AHDFS%E6%A6%82%E8%BF%B0/2.png" alt="image-20210516142136473" style="zoom:100%;">

<h4 id="3-1-NameNode节点"><a href="#3-1-NameNode节点" class="headerlink" title="3.1 NameNode节点"></a>3.1 NameNode节点</h4><p>&ensp;&ensp;&ensp;&ensp;当用户访问数据文件时，为了保证能够读取到每一个数据块， HDFS有一个专门 <code>负责保存文件属性信息</code>的节点，这个节点就是 <strong>NameNode</strong> 节点（即 名称节点 ），它是一个主管、管理者。</p>
<h5 id="3-1-1节点职责"><a href="#3-1-1节点职责" class="headerlink" title="3.1.1节点职责"></a>3.1.1节点职责</h5><p><strong>① 管理维护HDFS的命名空间</strong></p>
<p>&ensp;&ensp;&ensp;&ensp;NameNode管理HDFS系统的命名空间，维护文件系统树以及文件系统树中所有文件的元数据。管理这些信息的的文件分别是 <strong>edits</strong>（操作日志文件） 和 <strong>fsimage</strong>（命名空间镜像文件） 。</p>
<blockquote>
<p>  editlog(操作日志)：在NameNode启动的情况下，对HDFS进行的各种操作进行记录。（HDFS客户端执行的所有操作都会被记录到editlog文件中，这些文件由edits文件保存）</p>
<p>  fsimage：包含HDFS中的元信息（比如修改时间、访问时间、数据块信息等）。</p>
</blockquote>
<p><strong>② 管理数据块（Block）映射信息</strong></p>
<p>&ensp;&ensp;&ensp;&ensp;负责管理数据块上所有的元数据信息（管理DataNode上数据块的均衡，维持副本数量）。</p>
<p><strong>③ 接收客户端的请求</strong><br>&ensp;&ensp;&ensp;&ensp;接收客户端文件上传、下载、创建目录等的请求。</p>
<h4 id="3-2-DataNode节点"><a href="#3-2-DataNode节点" class="headerlink" title="3.2 DataNode节点"></a>3.2 DataNode节点</h4><p>&ensp;&ensp;&ensp;&ensp;HDFS首先把大文件切分成若干个小的数据块，再把这些数据块写入不同的节点，这个 <code>负责保存文件数据</code>的节点就是 <strong>DataNode</strong> 节点（即 数据节点 ）。</p>
<h5 id="3-2-1-节点职责"><a href="#3-2-1-节点职责" class="headerlink" title="3.2.1 节点职责"></a>3.2.1 节点职责</h5><p>&ensp;&ensp;&ensp;&ensp;DataNode节点 负责存储数据，把Block(数据块)以Linux文件的形式保存在磁盘上，并根据Block标识和字节范围来读写块数据。</p>
<p>&ensp;&ensp;&ensp;&ensp;其职责有以下三个方面（NameNode下达命令，DataNode执行实际的操作）：</p>
<p><strong>① 保存数据块</strong><br>&ensp;&ensp;&ensp;&ensp;一个数据块会在多个DataNode进行冗余备份（在某一个DataNode最多只有一个备份）。</p>
<p><strong>② 负责客户端对数据块的IO请求</strong><br>&ensp;&ensp;&ensp;&ensp;在客户端执行写操作时，DataNode之间会相互通信，保证写操作的一致性。</p>
<p><strong>③ 定期和NameNode进行心跳通信，接受NameNode的指令</strong><br>&ensp;&ensp;&ensp;&ensp;如果NameNode节点10分钟没有收到DataNode的心跳信息，就会将其上的数据块复制到其他DataNode节点。</p>
<p>&ensp;&ensp;&ensp;&ensp;因此，<code>NameNode节点上并不会永久保存DataNode节点上的数据块信息</code>，而是通过与DataNode节点心跳联系的方式，来更新节点上的映射表，以此减轻负担。</p>
<h4 id="3-3-SecondaryNameNode节点"><a href="#3-3-SecondaryNameNode节点" class="headerlink" title="3.3 SecondaryNameNode节点"></a>3.3 SecondaryNameNode节点</h4><p>&ensp;&ensp;&ensp;&ensp;HDFS有一个定期创建命名空间的检查点(CheckPoint)操作的节点，也就是SecondaryNameNode节点（即 第二名称节点）。</p>
<p>&ensp;&ensp;&ensp;&ensp;出于可靠性考虑，SecondaryNameNode节点与NameNode节点<code>通常运行在不同的机器上</code>，且SecondaryNameNode节点与NameNode节点的<code>内存要一样大</code>。</p>
<p>&ensp;&ensp;&ensp;&ensp;并非NameNode的<a target="_blank" rel="noopener" href="https://baike.baidu.com/item/%E7%83%AD%E5%A4%87">热备</a>。当NameNode挂掉的时候，它并不能马上替换NameNode并提供服务。</p>
<blockquote>
<p>  问题：一般情况下，一个集群中的SecondaryNameNode节点也是只有一个的原因是什么？<br>  答：因为如果多的话，会增加NameNode的压力，使其忙于元数据的传输/接收、日志的传输/切换，从而导致性能下降；同时，NameNode节点也不支持做并发检查点。</p>
</blockquote>
<h5 id="3-3-1-节点职责"><a href="#3-3-1-节点职责" class="headerlink" title="3.3.1 节点职责"></a>3.3.1 节点职责</h5><p><strong>①辅助NameNode，分担其工作量。</strong></p>
<p><strong>②定期合并Fsimage和Edits，并推送给NameNode。</strong></p>
<p><strong>③在紧急情况下，可辅助恢复NameNode。</strong></p>
<h4 id="3-4-Client客户端"><a href="#3-4-Client客户端" class="headerlink" title="3.4 Client客户端"></a>3.4 Client客户端</h4><ol>
<li> 文件切分。文件上传 HDFS 的时候，Client 将文件切分成一个一个的Block，然后进行存储。</li>
<li> 与NameNode交互，获取文件的位置信息。</li>
<li> 与DataNode交互，读取或者写入数据。</li>
<li> Client提供一些命令来管理HDFS，比如启动或者关闭HDFS。</li>
<li> Client可以通过一些命令来访问HDFS。</li>
</ol>
<hr>
<h3 id="四、HDFS-文件块大小"><a href="#四、HDFS-文件块大小" class="headerlink" title="四、HDFS 文件块大小"></a>四、HDFS 文件块大小</h3><p>&ensp;&ensp;&ensp;&ensp;HDFS中的文件在物理上是分块存储（block），块的大小可以通过配置参数(dfs.blocksize)来规定，默认大小在 hadoop2.x / 3.x 版本中是128M， hadoop1.x 版本中是 64M 。</p>
<img src="/myblog/myblog/2021/05/22/Hadoop%E4%B9%8BHDFS%EF%BC%9AHDFS%E6%A6%82%E8%BF%B0/3.png" alt="image-20210520191749176" style="zoom: 80%;">

<blockquote>
<p>  问题：HDFS数据块默认大小为128M（Hadoop2.2之前为64M），将HDFS的数据块设置得很大的目的是什么？（传统数据块只有512个字节）</p>
<p>  答：为了减少寻址开销，让HDFS的文件传输时间由传输速率决定（如果块设置得足够大，从磁盘传输数据的时间会明显大于定位这个块开始位置所需的时间）。</p>
</blockquote>
<blockquote>
<p>  思考：为什么块的大小不能设置太小，也不能设置太大?<br>  (1)HDFS的块设置太小，会增加寻址时间，程序一直在找块的开始位置;<br>  (2)如果块设置的太大，从磁盘传输数据的时间会明显大于定位这个块开<br>  始位置所需的时间。导致程序在处理这块数据时,会非常慢<br>  总结：HDFS块的大小设置主要取决于磁盘传输速率</p>
</blockquote>
<p><a target="_blank" rel="noopener" href="https://blog.csdn.net/qq_45069279/article/details/114483365">(4条消息) 一文了解 HDFS 及其组成框架_苜苜的烂笔头的博客-CSDN博客_hdfs</a></p>
<p><a target="_blank" rel="noopener" href="https://blog.csdn.net/qq_45069279/article/details/114734679">(4条消息) 干货满满，图文详解 HDFS 的 工作机制 及其原理_苜苜的烂笔头的博客-CSDN博客</a></p>
<p><a target="_blank" rel="noopener" href="https://www.bilibili.com/video/BV1Qp4y1n7EN?p=1">尚硅谷丨大数据Hadoop 3.x（2021全新升级/部署+源码+实战）_哔哩哔哩 (゜-゜)つロ 干杯~-bilibili</a></p>

    </div>

    
    
    

      <footer class="post-footer">
          <div class="post-tags">
              <a href="/myblog/tags/%E6%95%B0%E6%8D%AE%E7%A0%94%E5%8F%91/" rel="tag"># 数据研发</a>
              <a href="/myblog/tags/Hadoop/" rel="tag"># Hadoop</a>
              <a href="/myblog/tags/HDFS/" rel="tag"># HDFS</a>
          </div>

        


        
    <div class="post-nav">
      <div class="post-nav-item">
    <a href="/myblog/2021/05/22/Hadoop%E4%B9%8BHDFS%EF%BC%9AHDFS%E8%AF%BB%E5%86%99/" rel="prev" title="HDFS读写">
      <i class="fa fa-chevron-left"></i> HDFS读写
    </a></div>
      <div class="post-nav-item">
    <a href="/myblog/2021/05/22/Hadoop%E4%B9%8BHDFS%EF%BC%9AHDFS%E5%9C%A8%E7%94%9F%E4%BA%A7%E7%8E%AF%E5%A2%83%E4%B8%AD%E7%9A%84%E6%93%8D%E4%BD%9C/" rel="next" title="HDFS生产环境中的操作">
      HDFS生产环境中的操作 <i class="fa fa-chevron-right"></i>
    </a></div>
    </div>
      </footer>
    
  </article>
  
  
  



          </div>
          

<script>
  window.addEventListener('tabs:register', () => {
    let { activeClass } = CONFIG.comments;
    if (CONFIG.comments.storage) {
      activeClass = localStorage.getItem('comments_active') || activeClass;
    }
    if (activeClass) {
      let activeTab = document.querySelector(`a[href="#comment-${activeClass}"]`);
      if (activeTab) {
        activeTab.click();
      }
    }
  });
  if (CONFIG.comments.storage) {
    window.addEventListener('tabs:click', event => {
      if (!event.target.matches('.tabs-comment .tab-content .tab-pane')) return;
      let commentClass = event.target.classList[1];
      localStorage.setItem('comments_active', commentClass);
    });
  }
</script>

        </div>
          
  
  <div class="toggle sidebar-toggle">
    <span class="toggle-line toggle-line-first"></span>
    <span class="toggle-line toggle-line-middle"></span>
    <span class="toggle-line toggle-line-last"></span>
  </div>

  <aside class="sidebar">
    <div class="sidebar-inner">

      <ul class="sidebar-nav motion-element">
        <li class="sidebar-nav-toc">
          文章目录
        </li>
        <li class="sidebar-nav-overview">
          站点概览
        </li>
      </ul>

      <!--noindex-->
      <div class="post-toc-wrap sidebar-panel">
          <div class="post-toc motion-element"><ol class="nav"><li class="nav-item nav-level-3"><a class="nav-link" href="#%E4%B8%80%E3%80%81HDFS%E7%AE%80%E4%BB%8B"><span class="nav-text">一、HDFS简介</span></a><ol class="nav-child"><li class="nav-item nav-level-4"><a class="nav-link" href="#1-1%E3%80%81HDFS%E4%BA%A7%E7%94%9F%E8%83%8C%E6%99%AF"><span class="nav-text">1.1、HDFS产生背景</span></a></li><li class="nav-item nav-level-4"><a class="nav-link" href="#1-2%E3%80%81HDFS%E6%A6%82%E5%BF%B5"><span class="nav-text">1.2、HDFS概念</span></a></li></ol></li><li class="nav-item nav-level-3"><a class="nav-link" href="#%E4%BA%8C%E3%80%81HDFS%E4%BC%98%E7%BC%BA%E7%82%B9"><span class="nav-text">二、HDFS优缺点</span></a></li><li class="nav-item nav-level-3"><a class="nav-link" href="#%E4%B8%89%E3%80%81HDFS%E7%BB%84%E6%88%90%E6%9E%B6%E6%9E%84"><span class="nav-text">三、HDFS组成架构</span></a><ol class="nav-child"><li class="nav-item nav-level-4"><a class="nav-link" href="#3-1-NameNode%E8%8A%82%E7%82%B9"><span class="nav-text">3.1 NameNode节点</span></a><ol class="nav-child"><li class="nav-item nav-level-5"><a class="nav-link" href="#3-1-1%E8%8A%82%E7%82%B9%E8%81%8C%E8%B4%A3"><span class="nav-text">3.1.1节点职责</span></a></li></ol></li><li class="nav-item nav-level-4"><a class="nav-link" href="#3-2-DataNode%E8%8A%82%E7%82%B9"><span class="nav-text">3.2 DataNode节点</span></a><ol class="nav-child"><li class="nav-item nav-level-5"><a class="nav-link" href="#3-2-1-%E8%8A%82%E7%82%B9%E8%81%8C%E8%B4%A3"><span class="nav-text">3.2.1 节点职责</span></a></li></ol></li><li class="nav-item nav-level-4"><a class="nav-link" href="#3-3-SecondaryNameNode%E8%8A%82%E7%82%B9"><span class="nav-text">3.3 SecondaryNameNode节点</span></a><ol class="nav-child"><li class="nav-item nav-level-5"><a class="nav-link" href="#3-3-1-%E8%8A%82%E7%82%B9%E8%81%8C%E8%B4%A3"><span class="nav-text">3.3.1 节点职责</span></a></li></ol></li><li class="nav-item nav-level-4"><a class="nav-link" href="#3-4-Client%E5%AE%A2%E6%88%B7%E7%AB%AF"><span class="nav-text">3.4 Client客户端</span></a></li></ol></li><li class="nav-item nav-level-3"><a class="nav-link" href="#%E5%9B%9B%E3%80%81HDFS-%E6%96%87%E4%BB%B6%E5%9D%97%E5%A4%A7%E5%B0%8F"><span class="nav-text">四、HDFS 文件块大小</span></a></li></ol></div>
      </div>
      <!--/noindex-->

      <div class="site-overview-wrap sidebar-panel">
        <div class="site-author motion-element" itemprop="author" itemscope itemtype="http://schema.org/Person">
    <img class="site-author-image" itemprop="image" alt="高乾威"
      src="/myblog/images/avatar.png">
  <p class="site-author-name" itemprop="name">高乾威</p>
  <div class="site-description" itemprop="description">报我楼成秋望月，把君诗读夜回灯</div>
</div>
<div class="site-state-wrap motion-element">
  <nav class="site-state">
      <div class="site-state-item site-state-posts">
          <a href="/myblog/archives/">
        
          <span class="site-state-item-count">91</span>
          <span class="site-state-item-name">日志</span>
        </a>
      </div>
      <div class="site-state-item site-state-categories">
            <a href="/myblog/categories/">
          
        <span class="site-state-item-count">27</span>
        <span class="site-state-item-name">分类</span></a>
      </div>
      <div class="site-state-item site-state-tags">
            <a href="/myblog/tags/">
          
        <span class="site-state-item-count">59</span>
        <span class="site-state-item-name">标签</span></a>
      </div>
  </nav>
</div>
  <div class="links-of-author motion-element">
      <span class="links-of-author-item">
        <a href="http://github.com/GaoQianwei" title="GitHub → http:&#x2F;&#x2F;github.com&#x2F;GaoQianwei" rel="noopener" target="_blank">GitHub</a>
      </span>
      <span class="links-of-author-item">
        <a href="mailto:2966807184@qq.com" title="E-Mail → mailto:2966807184@qq.com" rel="noopener" target="_blank">E-Mail</a>
      </span>
      <span class="links-of-author-item">
        <a href="https://www.zhihu.com/people/xue-wu-zhi-jing-75-22" title="知乎 → https:&#x2F;&#x2F;www.zhihu.com&#x2F;people&#x2F;xue-wu-zhi-jing-75-22" rel="noopener" target="_blank">知乎</a>
      </span>
      <span class="links-of-author-item">
        <a href="https://blog.csdn.net/weixin_45341339" title="CSDN → https:&#x2F;&#x2F;blog.csdn.net&#x2F;weixin_45341339" rel="noopener" target="_blank">CSDN</a>
      </span>
  </div>



      </div><div>
  <canvas id="canvasDiyBlock" style="width:60%;">当前浏览器不支持canvas，请更换浏览器后再试</canvas>
<script src="/myblog/js/custom/clock.js"></script>

</div>


    </div>
  </aside>
  <div id="sidebar-dimmer"></div>


      </div>
    </main>

    <footer class="footer">
      <div class="footer-inner">
        

        

<div class="copyright">
  
  &copy; 2021-04 到 
  <span itemprop="copyrightYear">2022</span>
  <span class="with-love">
    <i class="fa fa-heart"></i>
  </span>
  <span class="author" itemprop="copyrightHolder">高乾威</span>
</div>
  <div class="powered-by">由 <a href="https://hexo.io/" class="theme-link" rel="noopener" target="_blank">Hexo</a> & <a href="https://theme-next.org/" class="theme-link" rel="noopener" target="_blank">NexT.Gemini</a> 强力驱动
  </div>

<span class="post-meta-divider">|</span>

<div class="theme-info">
  <div class="powered-by"></div>
  <span class="post-count">全站共 117.2k 字</span>
</div>

<span class="post-meta-divider">|</span>
        
<div class="busuanzi-count">
  <script async src="https://busuanzi.ibruce.info/busuanzi/2.3/busuanzi.pure.mini.js"></script>
</div>








      </div>
    </footer>
  </div>

  
  <script src="/myblog/lib/anime.min.js"></script>
  <script src="/myblog/lib/velocity/velocity.min.js"></script>
  <script src="/myblog/lib/velocity/velocity.ui.min.js"></script>

<script src="/myblog/js/utils.js"></script>

<script src="/myblog/js/motion.js"></script>


<script src="/myblog/js/schemes/pisces.js"></script>


<script src="/myblog/js/next-boot.js"></script>


  <script defer src="/myblog/lib/three/three.min.js"></script>
    <script defer src="/myblog/lib/three/canvas_lines.min.js"></script>


  




  
<script src="/myblog/js/local-search.js"></script>













  

  

</body>
</html>
